OpenAI/EvalsがGitHubで公開以下のような評価を作成し実行できるデータセットを使ってプロンプトを生成する、OpenAIモデルが提供する生成の品質を測定し、異なるデータセットやモデル間で性能を比較することができる。できるだけ少ないコードで、できるだけ簡単にevalを構築できる。 https://t.co/hPRvhZYOXT